
谷歌开源Gemma 3n:2G内存就能跑,100亿参数内最强多模态模型
谷歌开源Gemma 3n:2G内存就能跑,100亿参数内最强多模态模型本周五凌晨,谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。谷歌表示,Gemma 3n 代表了设备端 AI 的重大进步,它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能,其性能去年还只能在云端先进模型上才能体验。
本周五凌晨,谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。谷歌表示,Gemma 3n 代表了设备端 AI 的重大进步,它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能,其性能去年还只能在云端先进模型上才能体验。
中科院自动化所提出BridgeVLA模型,通过将3D输入投影为2D图像并利用2D热图进行动作预测,实现了高效且泛化的3D机器人操作学习。
今年的大模型已经「保底985、冲刺清北」了,明年还考吗? 果然,高考已经快被 AI 攻克了。
谷歌把最新的文生图模型 Imagen 4,以及它的 Pro Max 版 Imagen 4 Ultra,放到了 AI Studio 和 API 里。
当下的AI Agent领域,正上演着一幕“奇特”的景象,一方面,是关于Agent能力极限的狂热探讨;但另一方面,是当这些光鲜的Agent从实验室走向真实生产环境时的普遍“失速”与“沉寂”。
作为一家上市公司的老板,出门问问创始人、CEO 李志飞在最近的新品发布会上并未亲自讲解产品,而是分享了一场个人的「行为艺术」——一场「一人公司」的实验。
我们先来回顾一下近期相关事件: 6 月 18 日,Midjourney 发布首个 AI 视频生成模型 V1,标志其从静态图像创作向动态多媒体内容生产转型。V1 支持上传或用其他模型生成图像来生成视频片段,但有无法生成音频、时长限制等不足。Midjourney 透露长期目标是将多种技术融合为"世界模型",使用户能在动态生成的虚拟环境中自由探索。
越来越多的玩家开始涌入 AI Coding 赛道。
就在今天,AI医疗又诞生了一个超级独角兽! 据报道,自动化医疗笔记的 AI 初创公司 Abridge 获得了 3 亿美元的 E 轮融资,估值达到53亿美元(约合人民币380亿)。
6月22日,在 AGI Playground 2025 大会上,主办方靖亚资本、联合主办方 Founder Park、崔牛会一同正式发布了 2025 AI Cloud 100 China 榜单。